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@ Synthetische Signalsequenz zum Transport von Proteinen in Expressionssystemen 

Die DNA einer naturtichen Signalsequenz wird durch Ein- 
bau von Schnittstellen fur Endonucleasen modifiziert und 
laSt sich dadurch nach dem Baukastenprinzip in beliebige 
Vektoren einbauen. Die derart modifizierten Vektoren be- 
wirken dann einen Transport des codierten Proteins aus dem 
Zytoplasma. 
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PatentansprUphe ; HOE 84/F 

1 . Synthetische Signalsequenz zum Transport von Proteineh 
in Expressionssystemen, dadurch gekennzeichnet, daB 
die DNA im wesentlichen einer natiirliche Signalsequenz 
entspridht, aber eine oder mehrere Schnittstellen fur 

5 Endonucleasen aufweist, die in der natiirlichen DNA 
nicht enthalten sind. 

2. Signalfeequenz nach Anspruch 1, dadurch gekennzeichnet, 
daB sie interne Schnittstellen vor und/oder nach der 

10 hydrophoben Region" enthalt. 

3- Signalsequenz nach Anspruch 1 oder 2, dadurch gekenn- 
zeichnet, daB sie im wesentlichen der natiirlichen Sig- 
nalsequenz der Alkalischen Phosphatase von E. coli 
15 entspricht. 

4. Signalsequenz nach einem oder mehreren der vorhergehen- 
den Anspruche, dadurch gekennzeichnet, daB sie am 
3 ! -Ende bis zu etwa 40 der aminoterminalen Codons des 

20 Strukturgens enthalt. 

5. DNA der Formel I. 

6. Verfahren zur Transportexpression von Proteinen in 
25 prokaryotischen und eukaryotischen Zellen, dadurch 

gekennzeichnet, daB man das Gen fiir das zu transpor- 
tierende Protein an eine DNA-Sequenz nach Anspruch 
1 bis 5 koppelt, dieses Fusionsgen in einen Vektor 
einbaut und damit eine Wirtszelle transformiert , 
30 die das exprimierte Protein aus dem Cytoplasma trans- 
portiert. 
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7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, 
daS das transportierte Protein ein eukaryotisches, 
prokaryotisches Oder virales Protein ist. 

8. Verfahren nach Anspruch 6 Oder 7, dadurch gekennzeich- 
5 net, daB die synthetische DNA-Signalsequenz ein wirts- 

eigenes Protein kodiert. 

9. Hybridvektor , gekennzeichnet durch eine DNA-Sequenz 
nach Anspruch 1 "bis 5- 

10 

10. Hybridplasmid, das in einer Eco Rl-Schnitts telle die 
DNA-Sequenz I inseriert enthalt. 

11. Wirtsorganismus, enthaltend einen Vektor.nach Anspruch 
15 9 oder 10. 

12. E. coli, enthaltend einen Vektor nach Anspruch 9 oder 
10. 



20 
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Synthetische Signalsequenz zum Transport von Proteinen in 
Expressionssystemen 

Proteine Werden in der Zelle an den Ribosomen synthetisiert, 
die im Cytoplasma lokalisiert sind. Proteine, die aus dem 
Cytoplasma heraus transportiert werden, tragen am Amino- 
terminus eine relativ kurze Peptidkette, die beim Passieren 
5 durch die Cytopla3mamembran enzymatisch abgetrennt wird, wo- 
bei das "reife" Protein entsteht. Diese kurze Peptidsequenz 
wird als "Signalpeptid" oder auch als Prae- bzw. leader-Se- 
quenz bezeichnet. 

10 Es wurde schon fur eine Vielzahl sekretorischer Proteine 
die am Aminoterminus angeordnete Signalsequenz charakteri- 
siert. Sie besteht generell aus einer hydrophoben Region 
von etwa 10 bis 20 Aminosauren, die als "core" bezeichnet 
wird, an deren Aminoterminus eine kurze Peptidsequenz 

15 ("pre-core") gebunden ist, die meist eine positiv geladene 
Aminosaure (oder mehrere) aufweist. Zwischen dem Carboxy- 
terminus der hydrophoben Region ur.d dem Aminoterminus 
des "reifen" transportierten Proteins liegt eine kurze 
Peptidsequenz ("post-core"), welche die Spaltstelle 

20 ("splice-site") enthalt und fur eine gunstige raumliche 
Anordnung sorgt. 

Aus der tIS-Patentschrif t 4 411 994 ist bekannt, das Gen 
fur ein zu exprimierendes Protein an ein bakterielles Gen 

25 zu koppeln, das fur ein extracellu lares oder periplasma- 
tisehes Tragerprotein codiert, um so den Transport des ge- 
wUnschten Proteins aus dem Cytoplasma zu bewerkstelligen. 
Pur dieses Verfahren mufi man ein wirtseigenes , bakterielles 
Gen fur ein periplasmatisches, "outer membrane"- oder ein 

30 extracellulares Protein isolieren. Dieses Gen wird dann mit 
einem Restriktionsenzym geschnitten, das Gen fur das zu 
transportierende Protein in die gebildete Schnittstelle in- 
seriert und die Wirtszelle rait einem Vektor transformiert , 
der das so gebildete Pusionsgen enthalt. Die Isolierung 

35 des naturlichen Gens und seine Charakterisierung zur Auswahl 
geeigneter Schnittstellen ist auSerordentlich aufwendig. 
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ErfindungsgeraaS wird dieser Aufwand dadurch vermieden, . 
dafi von einer synthetischen Signalsequenz Gebrauch gemacht 
wird. 

5 Die Erfindung betrifft deshalb eine synthetische Signal- 
sequenz zum Transport von Proteinen in Expressionssystemen, 
die dadurch gekennzeichnet ist, daB die DNA im wesentlichen 
einer natUrlichen Signalsequenz entspricht, aber eine. Oder, 
mehrere Schnittstellen fUr Endonucleasen aufweist, die in 
10 der natUrlichen DNA nicht enthalten sind. tfeitere Aspekte 
der Erfindung und bevorzugte Ausgestaltungen sind inrfol- 
genden wiedergegeben bzw. in den PatentansprUchen nieder- 
gelegt . 

15 Die DNA soli "im wesentlichen" der einer natUrlichen Sig- 
nalsequenz entsprechen. Hierunter ist zu verstehen, daB das 
exprimierte Signalpeptid mit dem natUrlichen weitgehend 
oder vollig Ubereinstimmt , im letzteren Palle also ledig- 
lich auf der DNA-Ebene insofern ein Unterschied besteht, 

20 als die synthetische DNA mindestens eine Schnittstelle auf- 
weist, die in der natUrlichen DNA-Sequ'enz" nicht enthalten 
ist. Dieser Einbau der erf indungsgemaBen Schnittstelle be- 
dingt also eine mehr oder weniger groBe Abweichung von der 
natUrlichen Sequenz, wobei unter Umstanden auf Codons zu- 

25 nickgegriffen werden muB, die bekanntermaBen vom jeweiiigen 
Wirtsorganismus weniger bevorzugt werden. Uberraschender- 
weise ist hiermit jedoch kein Nachteil in der Expression 
verkmipft. Das gezielte "MaSschneidern" des synthetischen 
Gens bringt vielmehr so viele Vorteile mit sich, dafi ein 

30 eventueller Nachteil durch den "unnatUrlichen" Codon- 

Gebrauch im allgemeinen weit Uberkompensiert wird. Es hat 
sich sogar gezeigt, da3 der Ersatz des Startcodons GTG, 
das im Gen der Alkalischen Phosphatase von E. coli vorkommt, 
durch ATG zu einer stark erh'dhten Expression fuhrt. Ein 

35 besonderer Vorteil der Erfindung liegt darin, dafl die 

Wirtszelle weniger Ballast-Protein produzieren mu3, da das 
zu exprimierende Gen direkt an das 3 f ~Bnde der syntheti- 
schen DNA-Signalsequenz angekunpft werden kann. Ddriiber 
hinaus ergeben sich insofern Vorteile, als sich bei der 
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Konstruktion der synthetischen DNA an den Enden uber- 
stehende DNA-Sequenzen fur bestimmte Restriktionserken- 
nungsstellen Vorsehen lassen, die eine Klonierung dieser 
Sequanz erlatiben und im Palle unterschiedlicher Erkennurigs- 
5 stellen einen definierten Einbau in einen Klonierungsvek- 
tor gestatten. Hierdurch wird nach dem "Baukastenprinzip" 
ein Einbau in beliebige Vektoren ermoglicht. 

Interne Erkennungsstellen fur Restriktionsenzyme gestatten 
10 die Ankoppdlung beliebiger homologer oder heterologer Gene 
im richtigen Leserahmen. Uber diese internen Schnitt- 
stellen konnen auch auf einfache tfeise Variationen in die 
DNA der Signalsequenzen eingefuhrt werden, die zu in der 
Natur nicht vorkommenden Praesequenzen fiihren. 

15 

Zweckm'aSig verden diese internen Schnitt stellen in die 
Bereiche vor und nach der hydrophoben Region gelegt, ins- 
besondere in die ,! post-core"-Region, wobei die Spalt- 
stelle und/oder deren Umgebung modifiziert werden kann. 
20 Es ist naturlich auch mSglich, die "core"-Region in an 
sich bekannter Weise zu modif izieren. 

Unter Be rucks ichtigung bekannter Regeln (G. von Heijne, 
J. Mol. Biol- 173 (1984) 243 - 251) kann uber geeignete 

25 Schnittstellen im Genabschnitt , der fur den carboxytermina- 
len Teil des Praepeptids codiert, die Signal peptidase- 
Schrtittstelle derart geplant werden, daB kein Pusionspro- 
tein, sondern direkt das gewunschte, i.a. eukaryotische 
Peptid in native^ Form exprimiert wird. Gene natUrlichen 

30 Ursprungs lassen eine solche Prozessierung im allgemeinen 
nicht zu- 

Als Signalsequenzen kommen im Prinzip alle literaturbe- 
kannten Signalsequenzen' (M.E.E. Watson; Nucleic Acids Res. 
35 12 (1984), 5145 - 5164), Variationen derselben sowie daraus 
abgeleitete "idealisierte" Signalsequenzen (D. Perlman und 
H.O. Halvorson; J. Mol. Biol. 167 (1983), 391 - 409) in 
Betfacht. 
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Bevorzugte Wirtsorganisraen sind B. coli, Staphylococcus 
aureus, Bacillus subtilis, Streptomyces, Bacillus amyloli- 
quifaciens, Bacillus cerus, Bacillus lichenif ormis , Pseu- 
domonas, Saccharomyces, Spodoptera frugiperda und Zell- . 
5 linien hoherer Organismen wie pflanzliche Oder tierische 
Zellen. 

Prinzipiell lassen sich alle diejenigen Proteine prokaryo- 
tischen Oder eukaryotischen Urspungs durch Transportexpression 

10 gewinnen, die membrangangig sind. Bevorzugt sind aber phar- 
mazeutisch bedeutende Peptidprodukte wie Hormone, Lymphokine, 
Interferone, Blutgerinnungsfaktoren und Vakzirie, • die in 
der Natur auch als Peptide mit einer aminoterminalen Pi^e- 
sequenz codiert sind.* Diese eukaryotische Praesequenz wird 

15 jedoch in der Regel in den prokaryotischen Wirtsorganismen 
nicht von den wirtseigenen Signalpeptidasen abgespalten. 

In E. coli sind die Gene fur die periplasmatischen und 
"outer membrane !, -Proteine zur Transportexpression geeignet, 
20 wobei die erstgenannten das Produkt ins -Periplasma, die 
letztgenannten aber eher an die auBere Membrar* dirigieren. 

Als Beispiel wird die DNA-Signalsequenz des periplasma- 
tischen Proteins Alkalische Phosphatase, das in E. coli * 
25 hochexprimierbar ist, angefuhrt, ohne daB die Erfindung 
darauf beschrankt ware. 

Im folgenden ist die Prae-Sequenz einschliefllich der er- 
sten zwanzig Aminosauren der Alkalischen Phpsphatase von 
30 E. coli dargestellt: 

1 5 10 

Met-Lys-Gln-Ser-Thr-Ile-Ala-Leu-Ala-Leu-Leu-Pro-Leu-Leu- 

15 -20 25 

Phe-Thr-Pro-Val-Thr-Lys-Ala-Arg-Thr-Pro-aip-Met-Pro-Val- 

35 50 35 40 

Leu-Glu-Asn-Arg-Ala-Ala-Sln-Oly-Asn-Ile-Thr-Ala-Pro 



f= bevorzugte Spaltstelle der Signalpeptidase : 
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Es hat sich gefceigt, daS bis zu etwa 40, meist etwa 20 zu- 
satzliehe Aminosauren des reifen Proteins fur eine korrekte 
Pi*ozessiei*ung ausreichend sind. In vielen Fallen gemigen 
jedoch auch weniger zusatzliche Aminosauren, beispielsweise 
etwa 10, vofrteilh&ft etwa 5- Da eine kurzere Proteinkette 
5 eine geringere fceanspruchung des Protein-Biosynthese- 

apparats der> Wirtszelle bedingt, ist eine vorteilhafte Aus- 
ftthrungsforra der Erfindung in der DM-Sequenz I (Anhang) 
niedergelegt , die fur die Praesequenz der Alkalischen 
Phosphatase sowie zusatzlicher 5 Aminosauren des reifen 

10 Proteins codiert. Die DM-Sequenz I entspricht bis auf 
eirtige Triplett-Variationen - namlich solchen, die singu- 
iSre Rest^iktionsenzym-Schnittstellen einfuhren und das 
Startcodoh GIG durch ATG ersetzen - der natUrlichen Sequenz 
der Alkalischen Phosphatase. An den Enden des codierenden 

15 Stranges befinden sich "uberhangende" DNA-Sequenzen ent- 
sj?rechend der Restriktionsendonuclease EcoR L, die den Ein- 
bau in gangige Klonierungsvektoren, beispielsweise die 
handelsubiichen Plasmide wie pBR 322, pUC 8 Oder pUC 12 
erlauben* Zusatzlich wurden innerhalb des Gens der DNA- 

20 Sequent I eine Reihe von weiteren singularen Schnittstellen 
fUr Restriktionsenzyme eingebaut, die einerseits die Ankop- 
peiung heter^ologer Gene an der richtigen Stelle und im ge- 
wttnschten Leserahmeit ermogichen und andererseits auch die 
Durchfuhrung von Variationen erlauben: 



25 



Restriktionsenzym Schnitt nach Nucleotid-Nr . 

(im codierenden Strang) 



Sau 3 A . 19 

30 Pvu I 22 

Hpa II 54 ) (im naturlichen 

Nci I 54 ) Gen vorhanden) 

Alii I 66 

Hph I 68 

39 Ava II 70 
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Es ist selbstverstandlich auch moglich, die uberhangenden 
Sequenzen so zu konstruieren, daS sie verschiedenen Restrik- 
tionsenzymen entsprechen, was dann den Einbau in geeignete 
Vektoren in definierter Orientierung erlaubt. Der Eachmann 
5 wird hierbei abwagen, ob der mit dem Konstruieren d-es Gens 
und seinera gezielten Einbau verbundene Aufwand schwerer 
wiegt als die zusatzliche Selektionsarbeit , die mit Qinem 
Einbau in beiden Orientierungsr ichtungen bei identistJhen 
uberstehenden Enden verbunden ist. 

10 

Die DNA-Sequenz I laSt sich aus 6 Oligonucleotiden mit einer 
Lange von 26-31 Basen aufbauen, indem diese zun'achst che- 
misch synthetisiert und dann uber "sticky ends" von 6 Uuq- 
leotiden enzymatisch verkniipft werden. Der Einbau des 
15 synthetischen Gens in Klonierungsvektoren, beispielsweise 
in die genannten handelsublichen Plasmide, erfolgt in an 
sich bekannter Weise. 

Als Beispiel -fur die Expression eines eukaryotischen Gens 
20 in E. coli mit Hilfe einer erf indungsgemaflen Praesequenz 
wird im folgenden die Synthese von Aff en-Proinsulin be- 
schrieben: Man konstruiert eine DNA-Sequenz, bei der hinter 
einer chemisch-synthetischen Regulationsregion, bestehend 
aus einem bakteriellen Promotor, einem lac-Operator und 
25 einer ribosomalen Bindungsstelle (Deutsche Patentantrieldung 
P 34 30 683.8), 6-14 Nucleotide von der Ribosomen-Bin- 
dungsstelle entfernt, an eine anschlieSende Erkennungs- 
sequenz fUr EcoR I die DNA-Sequenz I und daran anschlieSend 
das Proinsulingen (W. Wetekam et al., Gene 19 (1932)179-183) 
30 angeordnet ist. Das exprimierte Proinsulin-Pusionspeptid 
enthalt am Aminoterminus noch 9 zusatzliche Aminosauren, 
die enzymatisch oder chemisch abgespalten werden kSnnen. 

Der Einbau des synthetischen Gens in pUC 8 sowie die Kon- 
35 struktion von Expressionsplasmiflen, die eukaryotische Gene 
an die DNA-Sequenz I gekoppelt enthalten, erfolgt in an 
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sich bekanner Weise. Hierzu kann auf das Lehrbuch von Ma- 
nifests (Molecular Cloning, Maniatis et al., Cold Spring 
Hkrboi*, 1982) verwiesen werden. Die Transformation der so 
erhalteneh Hybridplasmide in geeignete Wirtsorganismen, vor- 
5 teilhaft Ei coli, 1st ebenfalls an sich bekannt und in dem 
vorstehend genannten Lehrbuch eingehend beschrieben. Die 
Gevinnung der exprimierten Proteine und deren Reinigung ist 
ebenfalls beschrieben. 

10 In den fol^enden Beispielen werden noch einige Ausgestal- 
tungen dei* Erfindung im einzelnen erlautert, woraus sich 
die Vielgahl der moglichen Abwandlungen (und Kombinationen) 
ftir den Pkchmann ergeben. Prozentangaben beziehen sich hier- 
bei &uf d&s Gewicht, wenn nichts anderes angegeben ist. 

15 

Beispiele 

1 i Chemische Synthese eines einzelstrangigen Oligonucleotids 

20 Am Beispiel des Genbausteins la, der die Nucleotide 1-29 
ies dodierenden Strangs umfaBt, wird die Synthese der Gen- 
bausteine erlSuteft. Hach bekannten Methoden (M.J. Gait 
et al*, Nucleic Acids Res. 8 (1980) 1081 - 1096)) wird 
das am 3'^Ende stehende Nucleosid, im vorliegenden Palle 

25 also Guarlosin (Nucleotid Nr. 29), an Kieselgel (FRACI03IL, 
Pirma Merok) Uber die 3'-Hydroxyf unktion covalent ge- 
bunden. Hierzu wird zunachst das Kieselgel unter Abspal- 
tung von Ethanol mit 3-(Triethoxysilyl)-propylamin umge- 
setzt, wobei eine Si-O-Si-Bindung entsteht. Das Guanosin 

30 wird ais N 2 ! -Isobutyryl-3 ! -0-succinoyl-5 '-dimethoxytri- 
tylether in Gegehwart von Paranitrophenol und N,N ! -Di- 
cyclohexylcarbodiimid mit dem modif izierten Trager um- 
gesetzt, wobei die freie Carboxygruppe der Succinoyl- 
gruppe den Aminorest der Propylamingruppe acyliert. 
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In den folgenden Syntheseschritten wird die Basenkompo- 
nente als 5 f -0-Dimethoxytrityl-nucleosid^5V-phosp"horig- 
saure-mono'methylester-dialkylamid oder -chlorid einge- 
setzt, wobei das Adenin als N 6 -Benzoyl-VerbindungV'das 
Cytosin als N 4 -Benzoyl-Verbindung, das Guanin als N - 
Isobutyryl-Verbindung und das keine Aminogruppe enthal- 
tende Thymin ohne Schutzgruppe vorliegen. 

50 mg des polymeren Tragers, der 2 \xmol Guanosin gebun- 
den enth&lt, werden nacheinander mit den folgenden 
Agentien behandelt: 

a) Nitromethan , 

b) gesattigte Zinkbromidlbsung in Nitromethan mit 1 $ 
tfasser 

c) Methanol 

d) Tetrahydrofuran 

e) Acetonitril 

f ) 40 (imol des entsprechenden Kucleosidphosphits und 
200 ixmol Tetrazol in 0,5 ml wasserfreiem Acetonitril 
(5 Minuten) 

g) 20 $> Acetanhydrid in Tetrahydrofuran mit 40 f Lutidin 
und 10 $> Dimethylaminopyridin (2 Minuten) 

h) Tetrahydrofuran 

i) Tetrahydrofuran mit 20 $ Wasser und 40 % Lutidin 
j) 3 % Jod in Kollidin/Waasser/Tetrahydrofuran im 

Volumenverhaltnis 5:4:1 
k) Tetrahydrofuran und 
l) Methanol. 

Unter "Phosphit" wird hierbei der Desoxyriboser-3 '-mono- 
phosphorigsaure-monomethylester verstanden, wobei die 
dritte Valenz durch Chlor oder eine tqrtiare Aminogruppe, 
beispielsweise einen Morpholinorest , abges&ttigt ist. 
Die Ausbeuten der einzelnen Syntheseschritte konnen je-* 
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Weils nach der Detritylierungsreaktion (b) spektrophoto- 
metridch durch Messung der Absorption des Dimethoxytri- 
tylkations bei der Wellenlange von 496 nm bestimmt werden. 

5 Nach abgeschlossener Synthese des Oligonucleotids werden 
die Methylphosphatschutzgruppen des Oligomers mit Hilfe 
von p-Thioki*esol und Triethylylamin abgespalten. An- 
schlieBend wird durch 3-stundige Behandlung mit Ammoniak 
das 01i£onucleotid vom festen Trager abgetrennt. Eine 
10 2^ bis 5*-tagige Behandlung der Oligomeren mit konzen- 
triertem Ammoniak spaltet die Aminoschutzgruppen der 
Basen quantitativ ab. Das so erhaltene Rohprodukt wird 
dui*ch Hochdruckflussigkeitschromatographie (HPLC) oder 
durch Polyacfylamid-Gelelektrophorese gereinigt. 

15 

Ganz entsprechend werden auch die ubrigen Genbausteine 
lb - If synthetisiert, deren Nucleotidfolge aus der DNA- 
Sequenz II (Anh&ng) hervorgeht. 

20 2* Ertzymatische Verkniipfung der einzelstrangigen Oligonuc- 
leotide zui* DNA-Sequenz I 

Die endstandigen Oligonucleotide la und If werden nicht 
phosphoryliert . Damit wird eine Oligomerisation uber die 

25 uberh'angenden Enden vermieden. Zur Phosphorylierung der 
Oligonucleotide lb, Ic, Id und Ie werden jeweils 1 nmol 
dieser Verbindungen mit 5 nmol Adenosintriphosphat und 
vier Einheiten T4-Polynucleotid-Kinase in 20 \xl 50 mM 
Tris-HCl-Puffer (pH 7,6), 10 mM Magnesiumchlorid und 

30 10 mM Dithiothreitol (DTT) 30 Minuten bei 37°C behan- 
delt. Das Enzym wird durch funfminutiges Erhitzen auf 
95°C desaktiviert . AnschlieBend werden die Oligonucleo- 
tide la bis If vereinigt und zum Doppelstrang hybridi- 
siei*t, indem man sie in einer 20 mM KCl-Losung erhitzt 

35 und dann langsara (im Laufe von 2 Stunden) auf 16°C ab- 

kuhlt. Die Ligation zum DNA-Fragment gemaB DNA-Sequenz I 
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erfolgt durch Reaktion in 40 \xl 50 mM Tris-HCl-Puffer 
(20 mM Magnesiurachlorid und 10 mM DTT) mit Hilfe von '100 
Einheiten T4-DNA-Ligase bei 15°C im Laufe von 18 Stun- 
den. 

5 

Die Reinigung des Genfragments erfolgt durch Gelelektro- 
phorese auf einem 10 #igen Polyacrylamidgel (ohne Harn- 
stoffzusatz, 20 x 40 cm, 1 mm Dicke), wobei als Marker*- 
substanz 0X 1-74 DNA (Fa. BRL) , geschnitten mit Hinf I, 
10 Oder pBR 322, geschnitten mit Hae III, dient*. 

3. Einbau des Genf ragmentes in pUC 8 

Das handelsubliche Plasmid pUC 8 vird in bekannter 
15 Weise mit der Restriktionsendonuclease EcoR I nach den 
Angaben des Herstellers geoffnet. Der Verdauungsansatz 
wird auf einem 5 #igen Polyacrylamidgel durch Elektro- 
phorese in bekannter Weise aufgetrennt und die DNA 
durch Anfarben mit Ethidiurabromid oder durch radioaktive 
20 Markierung ("Nick-Translation 11 nach Maniatis, a.a.O. ) 

sichtbar gemacht. Die Plasmidbande wird anschlieflend aus 
dem Acrylamidgel ausgeschnitten und elektrophoretisch 
vom Polyacrylamid abgetrennt. 

25 4. Einbau der DNA-Sequenz I in ein Expressionsplasmid 

Das Expressionsplasmid pWI 6 mit der Information fixr 
das Affen-Proinsulin wird wie folgt konstruiert: 

30 10 \ig des Plasmids pBR 322 werden mit den Restriktions- 
endonucleasen Eco Rl/Pvu II verdaut und anschlie3end 
durch eine "f ill-in"-Reaktion mit Klenow-Polymerase an 
der Eco Rl-Schnittstelle aufgeflillt. Nach gelelektro- 
phoretischer Auftrennung in einem 5 ^igen Polyacrylamid- 

35 gel laSt sich das Plasmidf ragment von 2293 Bp LSnge 
durch Elektroelution gewinnen (Pigur 1). 
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Alis dem Plasmid pBR 322 mit integrierter Affenprapro- 
insulin-DNA (Wetekam et al., Gene 19 (1982) 179 - 183) 
wird diese durch Verdauung mit den Restriktionsendonuc- 
leasen Hind III und.Mst I isoliert und in das Plasmid 
5 pUC 9 wie folgt rekloniert: Das Plasmid pUC 9 wird mit 
dem Enfcym Bam HI gespalten, die Spaltstelle in einer 
St&ndai 4 d- ,l fill-in l! -Reaktion mit Klenow-Polymerase 
("large fragment") aufgefullt, mit dem Restriktionsenzyra 
llind III nachgeschnitten und die MA gelelektrophore- 

10 tisch in einem 5 #igen Polyacrylamidgel von den Ubrigen 
DNA-JVagmenten abgetrennt. In das geoffnete Plasmid 
Wii*d das isolierte Insulin-DNA-Fragment von etwa 1250 Bp 
Lange integriert. Zur Abtrennung der "untranslated 
region" und der PrSsequenz wird mit Hae III verdaut una 

15 das 143 Bp lange Fragment zur Abspaltung der letzten 

beiden Nucleotide aus der Prasequenz unter limitierenden 
Enzymbedingungen mit Bal 31 verdaut. Man erhalt so am 
Amino-Terminus als erstes Codon TTT, das fur Phenyl- 
alanin als erste Aminosaure der B-Kette steht. 

20 

An dieses Fragment wird nun ein fur Eco RI spezifischer 
Adaptor in einer "blunt-end" Ligationsreaktion ligiert: 

a) 5 f AA* TAT GAA TTC GCA ATG 
25 Eco RI TA CTT AAG CGT TAC 

b) 5 f AAT TAT GAA TTC GCA AGA 
Eco RI TA CTT AAG CGT TCT 

30 Urn eine Polymerisierung der Adaptor en zu vermeiden, wur- 
deh diese unphosphoryliert in die Ligationsreaktion ein- 
gesetzt. Der Adaptor a) weist am Ende ein Codon fur Me- 
thionin auf , der Adaptor b) das Codon fur Arginin. Nach 
dei* Variante a) wird somit ein Genprodukt erhalten, bei 

35 dem durch Bromcyanspaltung eine Abtrennung des bakte- 
riellen AnteilS moglich ist, wahrend die Variante b) 
eine Trypsinspaltung erlaubt. 
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Das Ligationsprodukt wird mit Mbo II yerdaut, Nach gel- 
elektrophoretischer Auftrennung erhalt man etn DNA~Frag- 
ment von 79 Bp Lange mit der Information fUr die 
Aminosaoren Nr. 1 bis 21 der B-Kette. 

5 Das Gen fUr die restliche Information des Proinsulin- 

molekiils (einschlieBlich einer G-C-Sequenz aus der Klo- 
nierung und 21 Bp aus dem pBR 322 im AnschluS an das 
Stop-Codon) erhalt man aus dem pUC 9-Plasmid mit der 

10 kompletten Praproaffeninsulin-Information durch Ver- 
dauung mit Mbo Il/Sma I und Isolierung eines DNA- 
Fragments von etwa 240 Bp Lange. Durch Ligieren der 
heiden Proinsulin-Fragmente erhalt man das. korrekte Li~ 
gationsprodukt von etwa 320 Bp Lange (inklusive des 

15 Adaptors von 18 Bp). Dieses so konstruierte Proinsolin- 
DNA-Fragment kann nun mit einer Regulationsreg'ion Uber 
die Eco Rl-negative Schnittstelle zusamraenligiert wer- 
den. 

20 Die gesamte Reaktionsfolge zeigt die Pig. 2, in der A, 

B und C die DM fur die jeweiligen Peptidketten des Prp- 
insulinmolekUl3, Ad den (dephoshorylierten) Adaptor (a 
Oder b) und P die DNA fur die Pr'asequenz des Affenpr'a- 
proinsulins "bedeuten. • 

25 Bine chemisch-synthetische Regulationsregion bestehend 
aus einer Erkennungssequenz fUr Bam HI, dem lap- 
Operator, einem bakteriellen Promotor und einer ribpsor, 
malen Bindungsstelle (RB) mit einem ATG-Start-Codon , 6 

30 bis 14 Nucleotide von der RB entfernt, und einer an^ 

schlieQenden Brkennungssequenz fur Eco RI (Pigur 3) wird 
uber die gemeinsaae Eco Rl-tiberlappungsregion mit dem 
nach dem vorstehenden Beispiel erhaltenen Proinsulin- 
Pragment ligiert. Nach einer Doppelverdauung mit Sma 

35 I/Bam HI und einer "fill-in" Reaktion der Bam HI 

Schnittstelle mit dem Kle enow-Fragment wird das Ligie- 
rungsprodukt (ungefahr 420 Bp) gelelektrophoretisch isp^ 
liert. 
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Das so erhaitene Fragment lafit sich anschliefiend iiber 
eine ,f blt>nt-ertd" Ligierung in das pBR 322-Teilplasmid 
gem'afi Figur 1 hineinligieren (Figur 4). Man erhalt das 
Hybridplasmid pWI 6. 

Nfeich Transformation in den E. coli-Stamm HB 101 und Se- 
lektion auf Ampicillin-Platten wurde die Plasmid-DM in- 
dividueller Klone auf die Integration eines 420 
Bp-Fragments mit der Regulationsregion und dem Bal 
31-*verkurzten Proinsulingen getestet. Zum Nachweis der 
korrekten Vferkiirzung des Proinsulingens durch Bal 31 
(Figur 2) wurden die Plasmide mit dem integrierten ^ 
PrOinsulinfragment' von der Eco Rl-Schnittstelle aus 
sequenziert. Von 60 sequenzierten Klonen hatten drei die 
gewUnschte Verkiirzung von zwei Nucleotiden (Figur 4). 

1 jig des Plasmidefc pWI 6 wird mit dem Restr iktions- 
enzym Eco RI ge^clinitten und anschliefiend in Gegenwart 
Von 30 ng DNA~Sequenz I bei 16°C in 6 Stunden zusammen- 
ligiert. Nach Transformation in E. coli HB 101 werden 
aus individuellen Klonen Plasmide isoliert und mit Hilfe 
einer Restriktionsenzymanalyse auf die Integration der 
DNA-Sequenz I getestet, 7 $> aller Klone enthielten das 
Plasmid pWI 6 mit der DNA-Sequenz I integriert. 

Die Richtung dieser Integrationsreaktion laflt sich mit 
Standardmethoden der Restriktionsenzymanalyse uber eine 
DoppelVerdauung mit Hind IIl/Pvu I eindeutig ermitteln. 
Das Plasmid pWI 6 mit einer DNA-Sequenz I in korrekter 
Leserichtung zum Proinsulin integriert ist als pWIP 1 in 
Figur 5 dargestellt. 

Dieses Plasmid kann anschliefiend in verschiedene 

E* coli-Stamme hineintransf ormiert werden, urn die Syn- 

thesekapazitat der einzelnen Stamme auszutesten. 
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Die Expression der Praesequenz-Proinsulin-Fusion in 
B. coli wird folgendermaQen bestimmt: 

1 ml einer mit IPTG- (isopropyl-p-D-thiogalaktopyranosid) 
5 induzierten Bakterienkultur bei einer optischen Dichte 
von 1 ,0 und einer Induktionsdauer von 1 Stunde werden 
mit PMSF (Phenylmethylsulfonylfluorid) in einer Endkon- 
zentration von 5x10 -4 M gestoppt, in Eis gekUhlt und 
abzentrifugiert. Der Zellniederschl'ag wird anschlieSend 

10 in 1 ml Puffer (10 mM Tris-HCl, pH 7,6; 40 mM NaCl) ge- 
vraschen, abzentrifugiert und in 200 \il Puffer (20 * 
Saccharose; 20 mM Tris-HCl, pH 8,0; 2 mM EDTA). resus- 
pendiert, 10 Minuten bei Zimmertemperatur inkubiert, ab- 
zentrifugiert und sofort in 500 \il HgO btdest. resuspen- 

15 diert. Nach 10 Minuten Inkubationszeit in Sis werden die 
"Schock-lysierten" Bakterien abzentrifugiert und der 
Uberstand eingefroren. Dieser Uberstand wird in einera 
Standard-Insulin-RIA (Amersham) auf Proinsulingehalt ge- 
testet. 

20 

Der Bakterienniederschlag wird noch einmal in 200 \il ly* 
sozympuffer (20 # Saccharose; 2 mg/ml Lysozym; 20 mM 
Tris-HCl, pH 8,0; 2 mM EDTA) resuspendiert ,. 30 Minuten 
in Eis inkubiert, 3 mal 10 Sekunden mit Ultraschall be- 
25 handelt und anschlieBend abzentrifugiert. Der so resul- 
tierende tiberstand wird als Plasmaf raktion auf Gehalt an 
Proinsulin in einem Radioimmunoassay getestet. 

Individuelle Bakterienklone, welehe das Piasmid pWIP 1 
30 enthalten, wurden auf ihre Synthesekapazitat und ihre 

Transportfahigkeit des Proinsulin r Praeseq,uenz-Produktes 
untersucht. Es konnte gezeigt werden, daB samtliche Bak- 
terienklone in erwarteter Weise das produzierte Pro- 
insulin zu ungefahr 90 * in den periplasmatischen Raum 
35 transportierten. Ungefahr 10 g der Proinsulin-RIA-Akti- 
vi'at waren noch in der Plasmaf raktion zu finden. 



DNA-Sequenz I 
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Triplett Nr. 12 3 

Aminos'aure Nr. Met Lys Gin 

Nucleotid Nr. 5 10 

Codierender Strang 5' AA TTC ATG AAA CAA 

nichtcod. Strang 3' G TAC TTT GTT 



4 5 

Ser Thr 

15 20 

AGO ACG 

TCG TGC 



6 7 
He Ala 

25 

ATC GO A 
TAG CGT 



8 9 
Leu Ala 

30 

CTG GCA 
GAC CGT 



10 11 

Leu Leu 

35 

CTC TTA 

GAG AAT 



12 13 

Pro Leu 

40 

CCG TTA 

GGC AAT 



14 15 16 17 18 19 20 21 22 23 

Leu Phe Thr Pro Val Thr Lys Ala Arg Thr 

45 50 55 60 65 70 

CTG TTT ACC CCG GTG ACA AAA GCT CGG ACC 

GAC AAA TGG GGC CAC TGT TTT CGA GCC TGG . 



24 25 26 
Pro Glu Met 

75 80 84 
CCA GAA ATG G 3' 
GGT CTT TAC CTT AA 5' 
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DNA-Sequenz II; 



5' AA TTC ATG AAA 
31 (j TAC TTT 
Eco RI -4. — 



- Ia 
CAA 
GTT 



AGC 
TCG 



TGC 
- Ib 



ATC 
TAG 



GCA 
CGT 



CTG 
GAC 



<A 

GCA 


CTC 


TTA 


CCG 


- Ic - 
TTA 


CTG 


TTT 


ACC 


f*- 

CCG 


CGT 


GAG 


AAT 


GGC 


AAT 


GAC 


AAA 
- Id — 


TGG 


GGC 


p» ■ 


< 












— , — ^-r-Eco 


«4 

3-TG 


ACA 


AAA 


GCT 


- Ie — 
CGG 


ACC 


CCA 


GAA 


ATG G 



CAC 



TGT 
1» 



TTT 

■A 



CGA GCC 



TGG 
- If 



GGT CTT 



TAC CTT AA 
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